Méthodologie de Matching à large Echelle de schémas XML
نویسندگان
چکیده
RÉSUMÉ. Le matching, est une opération importante pour les processus assurant l’interopérabilité de systèmes d’information notamment pour des applications telles que l'échange, l'intégration et la transformation de données. Toutefois, la problématique du matching se pose avec acuité lorsque le nombre et le volume des schémas de données est important. C’est notamment le cas pour les applications e-business avec une très forte orientation internet. Dans ce contexte, nous proposons, dans cet article, une méthodologie de matching à large échelle structurée en trois différentes phases (pré-matching, matching et post-matching), qui vise à optimiser le matching grâce à une phase préalable de prétraitement qui se base sur des techniques d’analyse, de traitement linguistique des éléments des schémas et d’extraction de données. Cette méthodologie est supportée par une plateforme nommée PLASMA (Platform for LArge Scale MAtching) qui a permis de conduire une série d’expérimentations.
منابع مشابه
Intégration de sources hétérogènes par matching semi-automatique de schémas XML étendus
RÉSUMÉ. Lors de l’intégration de sources de données hétérogènes, une des tâches les plus importantes est la transformation (semi-)automatique de ces sources par une phase de recherche de correspondances appelée schema matching. Le but de cet article est de proposer une solution lors de la phase de matching entre des schémas XML étendus appelés EXS (Enhanced XML Schemas). L’ensemble des schémas ...
متن کاملSchema Matching and Integration in Large Scale Scenarios. (Intégration de Schémas Large Echelle)
متن کامل
Recherche de sous-structures fréquentes pour l'intégration de schémas XML
Résumé. La recherche d’un schéma médiateur à partir d’un ensemble de schémas XML est une problématique actuelle où les résultats de recherche issus de la fouille de données arborescentes peuvent être adoptés. Dans ce contexte, plusieurs propositions ont été réalisées mais les méthodes de représentation des arborescences sont souvent trop coûteuses pour permettre un véritable passage à l’échelle...
متن کاملEnsuring Query Compatibility with Evolving XML Schemas
During the life cycle of an XML application, both schemas and queries may change from one version to another. Schema evolutions may affect query results and potentially the validity of produced data. Nowadays, a challenge is to assess and accommodate the impact of theses changes in rapidly evolving XML applications. This article proposes a logical framework and tool for verifying forward/backwa...
متن کاملDu XML au multidimensionnel : Conception de magasins de données
Résumé. Avec l’ouverture des entreprises sur l’Internet, les sources de données englobent davantage des données échangées avec les partenaires et/ou issues du Web. Dans ce cadre organisationnel ouvert, les documents XML constituent des sources de données plus utilisées aussi bien pour le stockage que pour les échanges transactionnels. Ce nouveau format de données a motivé des propositions de mo...
متن کامل